Equipo: 2
Integrantes:
Paola Albarrán Godoy (palbarran)
Ariadna Angélica Badía Zamudio (abadia)
Yael Daniel Hernández González (yhernandezg)
Correos electrónicos de los integrantes:
sc0bly16@hotmail.com
aribadia93@gmail.com
yaelhgs@gmail.com
Bioproject: PRJNA1198988
Especie: Homo sapiens
Tipo de bibliotecas: paired-end
Método de selección: Se realizó mediante selección de poli(A), utilizando el kit NEBNext Ultra II RNA Library Prep Kit for Illumina.
Número de transcriptomas: 9
Número de réplicas biológicas: 3 réplicas biológicas por cada condición experimental. Los SRA correspondientes a cada réplica son los siguientes:
Condición 1 (ATF3): SRX27100265, SRX27100266, SRX27100267
Condición 2 (Aart6): SRX27100262, SRX27100263, SRX27100264
Condición 3 (Vehículo): SRX27100268, SRX27100269, SRX27100270
Secuenciador empleado: Illumina HiSeq 2000
Distribución de las muestras: 3 condiciones experimentales con 3 réplicas biológicas cada una: ATF3 (factor de transcripción artificial), Aart6 (control isogénico), Vehículo (control)
Profundidad de secuenciación de cada transcriptoma: ~26-40 millones de lecturas
Tamaño de las lecturas: 150 bp
Artículo científico: King A, Noblitt D, Sherron O, Kjerfve C, Pless L and Truex NL (2025) An artificial transcription factor that activates potent interferon-γ expression in human Jurkat T Cells. Front. Mol. Med. 4:1492370. doi: 10.3389/fmmed.2024.1492370
Los factores de transcripción artificiales (ATFs) representan una herramienta prometedora para modular la expresión génica con fines terapéuticos. En este reporte, caracterizamos un ATF diseñado para activar la expresión de interferón-gamma (IFN-γ) en células Jurkat humanas mediante análisis de RNA-seq. Utilizando datos de 9 transcriptomas (3 condiciones: ATF3, Aart6, Vehículo), identificamos 135 genes diferencialmente expresados en ATF3 vs Vehículo, incluyendo IFNG, STAT1 y moléculas del complejo HLA. El análisis funcional reveló enriquecimiento en vías inmunes como “cell surface receptor signaling pathway” (p.adj = 1.2e-10) y “defense response to symbiont” (p.adj = 2.8e-5), mientras que el control Aart6 mostró términos no inmunes (ej: “neuronal synaptic plasticity”). Estos resultados demuestran que ATF3 activa específicamente programas transcripcionales asociados a IFN-γ, respaldando su potencial en inmunoterapia contra cáncer e infecciones.
Figura 1.Pipeline para analisis de los transcriptomas
Se analizó la calidad de las secuencias y por posición en los datos crudos, la mayoría de las secuencias están en la zona verde (Phred > 30), lo que indica una calidad buena (Figura 2A). Las últimas 10 posiciones muestran un Phred score promedio de Q25 (vs. Q35 en posiciones iniciales), dentro del rango aceptable para análisis sin trimming, lo cual es normal en datos de secuenciacion.
Por secuencia, igual se encuentran en la zona verde (Phred >30), lo que indica que la calidad general de las lecturas es bastante alta. (Figura 2B)
Figura 2. Calidad de las secuencias en muestras con ATF3, Aart6 y controles. (A) Calidad por posición de base: Distribución del Phred score promedio (eje Y) en cada posición de la secuencia (eje X). Las barras/áreas coloreadas indican la proporción de reads con calidad dentro de rangos específicos (B) Distribución de Phred scores por read
La siguiente gráfica muestra el contenido GC por secuencia, esta gráfica es una distribución unimodal y relativamente simétrica, lo que es una buena señal, y sin anomalías evidentes. (Figura 3)
Figura 3.Distribucion de las variaciones en el porcentaje de %GC en las muestras
Se indican la proporción de bibliotecas que estan representadas por secuencias duplicadas (Figura 4A). Se observa que un porcentaje significativo de la biblioteca está compuesto por secuencias altamente duplicadas. Esto podría sugerir que hay una baja diversidad en las secuencias, lo que podría ser problemático para el análisis de expresión génica, ya que podría sesgar los resultados.
La presencia de secuencias de adaptadores en funcion de la posición en las lecturas (Figura 4B). Se observa que el porcentaje de secuencias con adaptadores aumenta a medida que avanza la posición en las lecturas. Esto es común, ya que los adaptadores tienden a aparecer más hacia el final de las lecturas cuando el fragmento de ADN es más corto que la longitud de la lectura
Figura 4. Análisis de duplicación de secuencias y contenido de adaptadores (A) Muestra el porcentaje de lecturas que están duplicadas en el conjunto de datos. (B) Presencia de secuencias de adaptadores en las lecturas, por posición en la secuencia.
La calidad de las secuencias es alta, lo que es un buen punto de partida para el análisis. Sin embargo, la alta duplicación de secuencias y la presencia de adaptadores hacia el final de las lecturas son aspectos que deben abordarse antes de proceder con el análisis de expresión génica
El trimming con Trimmomatic (parámetros: LEADING:3, TRAILING:3, SLIDINGWINDOW:4:20, MINLEN:80) mejoró significativamente la calidad de los datos:
En la Figura 5A, el aumento de Phred scores (Q≥30) en posiciones 1-15 y 135-150 refleja la remoción eficiente de bases de baja calidad. La Figura 5B muestra dos poblaciones: reads paired (85%, Phred ~35) y unpaired (15%, Phred ~25), estas últimas descartadas en análisis posteriores.
Figura 5. Calidad de las secuencias en transcriptomas procesados con Trimmomatic (A)Calidad por posición: Las zonas verdes (Q≥30) aumentaron en posiciones 1-15 y 135-150 post-trimming. (B) Distribución de calidad: Dos picos corresponden a reads paired (Phred ~35) y unpaired (Phred ~25), siendo estas últimas minoría tras el filtrado.
Se observa una remoción de adaptadores, con contaminación residual <1% en todas las posiciones (vs. 12% pre-trimming) (Figura 6A), al igual que una reducción de duplicaciones de (12% → 4%) y el aumento de reads únicas (75% → 88%) indican una biblioteca más diversa y menos sesgada (Figura 6B).
La reducción de duplicaciones al 4% minimiza falsos positivos en expresión diferencial, y reads >80 bp mejoran la precisión de alineación en STAR.
Figura 6. Análisis de duplicación de secuencias y contenido de adaptadores (A) Contenido de adaptadores: Porcentajes <1% en todas las posiciones (vs. picos del 5% pre-trimming). (B) Duplicaciones: Nivel 1 (reads únicas) aumentó del 75% al 88%, confirmando mayor diversidad.
Estas mejoras impactan directamente en la precisión de mapeo y la confiabilidad de la cuantificación génica, justificando el uso de trimming en flujos de trabajo de RNA-seq.
Se utilizo STAR para realizar alineamiento y conteo debido a su capacidad detección de empalmes. El alineamiento se hizo contra el genoma de referencia humano GRCh38, además de un archivo de anotaciones en formato GTF.
| Muestra | Lecturas_totales | Unicamente_mapeadas | Multiple_loci | Empalmes_detectados |
|---|---|---|---|---|
| SRR31738155 | 126,820,399 | 94.65% | 3.46% | 32,781,965 |
| SRR31738156 | 25,835,342 | 94.71% | 3.47% | 33,020,758 |
| SRR31738157 | 37,489,513 | 94.48% | 3.53% | 45,076,063 |
| SRR31738158 | 25,139,871 | 94.51% | 3.55% | 29,779,896 |
| SRR31738159 | 22,482,888 | 84.2% | 13.3% | 22,522,628 |
| SRR31738160 | 31,286,772 | 94.51% | 3.62% | 37,192,720 |
| SRR31738161 | 24,751,003 | 94.48% | 3.56% | 28,680,358 |
| SRR31738162 | 30,653,048 | 94.51% | 3.46% | 34,972,520 |
| SRR31738163 | 30,535,296 | 94.47% | 3.52% | 34,886,750 |
Las estadísticas del alineamiento mostraron un alto porcentaje de lecturas mapeadas en donde en la mayoría de las muestra tenían un 93.3%, indicando un alineamiento eficiente.Además, el porcentaje de lecturas que mapearon en múltiples loci se mantuvo bajo (alrededor de un 4.6%).
Sin embargo, nos percatamos que una muestra (SRR31738159) mostró diferencias en comparación con las demás, ya que su porcentaje de lecturas mapeadas eran más bajo (84.2%) y su porcentaje de lecturas mapeadas en múltiples loci más alto (13.3%), lo que podría ser consecuencia de una menor calidad de lecturas o de una mayor cantidad de presencia repetidas.
Por otro lado, todas las muestras mostraron un alto número de empalmes, en un rango de 22,522,628 a 45,076,063 empalmes.
Se cuantificarón 78,724 transcritos/features anotados en el archivo GTF (ej: genes, isoformas, regiones no codificantes), con un promedio de 20,914,767 lecturas asignadas por muestra
La distribución de cuentas normalizadas (log2) mostró consistencia entre las muestras (Figura 7), respaldando la ausencia de sesgos técnicos mayores. como una mediana cercana a 10 en todas las muestras y un rango intercuartílico similar (log2: 8-12), con outliers mínimos.
Figura 7.Distribución de cuentas normalizadas por muestra.Cada boxplot representa la distribución de log2(Counts + 1) para una muestra. La línea central indica la mediana, los bordes del cuadro el IQR (25-75%), y los bigotes 1.5 × IQR.
La uniformidad observada respalda la eficacia del trimming (Figura 5) y el alto porcentaje de lecturas mapeadas (Tabla 1), confirmando que los sesgos técnicos son mínimos. Estos resultados validan la uniformidad técnica del experimento, permitiendo análisis robustos de expresión génica diferencial.
Para identificar genes diferencialmente expresados entre las condiciones de vehiculo, Aart6 y ATF3 , se utilizo DESeq2, con un umbral de significancia de \(|log2FC| \geq 2\) y \(p-valor\) ajustado \(<0.05\) . Los genes con menos de 10 conteos totales fueron filtrados para reducir ruido técnico.
El PCA realizado con datos transformados por rlog (Figura 8) mostrarón una clara separación de las muestras según las condiciones experimentales (Vehículo, Aart6, ATF3) . La variabilidad capturada por los dos primeros componentes principales (PC1 y PC2) explicó el 94% de la varianza total, indicando que las diferencias biologicas entre las condiciones son el principal factor de variación en el conjunto de datos.
Las muestras de cada condición forman clusters bien definidos y sin superposición, lo que sugiere efectos transcripcionales distintivos de cada condición. Existe una distancia entre grupos refleja la magnitud de las diferencias biologicas, y el ATF3, tiene una mayor divergencia respecto al control (Vehículo), un hallazgo consistente con estudios previos que utilizan factores de transcripcion artificiales (ATFs) para modular redes génicas específicas [1]
Hay una ausencia de agrupamiento por lotes, validando la homogeneidad dentro de cada condicion y la consistencia del efecto de las condiciones.
Figura 8. Análisis de Componentes Principales (PCA) post-transformación rlog
En el contraste ATF3 vs Vehículo, se identificarón 135 genes diferencialmente expresados (126 upregulated, 9 downregulated). Se destacan los siguientes genes:
Top upregulated genes:
ART1, DNER, HSD11B1, CTCFL, EIF4E1B, ART5, OLIG2, IL11, IFNG, TRBV26OR9-2, CKMT1B, PTENP1-AS, PTH2, NGEF, ARX, REPS2, GFY, EFNB2, ERBB3, SLC8A3Top downregulated genes:
CGA, CPA3, DHRS2, PRELID2, PKIA-AS1, VCAM1, IL18R1, AHSP, CDH24Los volcano plots (Figura 9) destacan la regulación positiva de genes clave como IFNG, STAT1, HLA-A, TNF e IL11, junto con la ausencia de cambios significativos en el control Aart6 (Figura 9A-C). Estos resultados coinciden con estudios que vinculan la activación de IFN-γ con la inducción de moléculas del complejo mayor de histocompatibilidad (HLA) y vías de señalización JAK-STAT [2][3].
La regulación positiva de IL11 en ATF3 esta asociada con respuestas antifibróticas más que proinflamatorias [4]. Sin embargo, trabajos recientes sugieren que IFN-γ puede modular funciones pleiotrópicas de citoquinas dependiendo del contexto celular [5], lo que respalda la observación. Por otro lado, la falta de genes significativamente regulados en Aart6 vs Vehículo (Figura 9C) valida su diseño como control isotipo, similar a constructos no funcionales reportados en estudios con proteínas de dedos de zinc [1].
Figura 9. Volcano plots de expresión diferencial. (A) ATF3 vs Vehículo (B) ATF3 vs Aart6 (C) Aart6 vs Vehículo
El heatmap (Figura 10) muestra los perfiles de expresión de 28 genes clave predefinidos en el artículo de referencia, relacionados con respuestas inmunes y señalización celular. Las muestras se agruparon según las condiciones (Vehículo, ATF3, Aart6).
Muestra una sobreexpresión robusta de genes asociados a la inmunidad (STAT1, IFNG, TNF, HLA-A/B/C) en ATF3, contrastando con la expresión basal en Vehículo y Aart6. Estos patrones reflejan la capacidad del ATF3 para activar vías inmunes innatas y adaptativas, un mecanismo crítico para mejorar la presentación de antígenos y la actividad antitumoral. La menor expresión de genes como VCAM1 en Aart6 sugiere efectos mínimos no específicos, respaldando su uso como control negativo.[1][6]
Figura 10. Heatmap de Expresión Génica Perfiles de 28 genes clave. Escala: rojo (alta expresión), azul (baja expresión). Muestras ordenadas por condición.
Los resultados en general demuestran que ATF3 activa eficientemente la expresión de IFN-γ y sus vías asociadas, respaldando su potencial para aplicaciones en cáncer e infecciones.
Se realizó un análisis de enriquecimiento funcional mediante g:Profiler para identificar procesos biológicos, componentes celulares y rutas moleculares asociadas a los genes diferencialmente expresados entre las condiciones ATF3, Aart6 y Vehículo. Se utilizaron bases de datos como Gene Ontology (GO), Reactome, CORUM y Transcription Factors, aplicando un umbral de significancia ajustado (p.adj < 0.05) para controlar falsos positivos mediante corrección de FDR.
Este enfoque permitió capturar términos biológicamente relevantes vinculados a la activación de IFN-γ y su impacto en la respuesta inmune.
El analisis revelo que el factor de transcripción artificial ATF3 activa vías inmunes clave relacionadas con la señalización de IFN-γ, mientras que el control Aart6 carece de efectos específicos sobre estas rutas (Figuras 11-13).
En el contraste ATF3 vs Vehículo, los términos más enriquecidos incluyeron “cell surface receptor signaling pathway” (p.adj = 1.2e-10) y “cytokine-mediated signaling pathway” (p.adj = 3.5e-8), lo que refleja la activación de rutas JAK-STAT y moléculas del complejo HLA (Figura 11). Estos hallazgos son consistentes con estudios previos que vinculan la sobreexpresión de IFN-γ con la regulación de la presentación de antígenos y la activación de células T citotóxicas [3]. Por ejemplo, Castro et al. (2018) demostraron que IFN-γ induce la expresión de HLA en células tumorales, mejorando la respuesta inmune adaptativa [3], un mecanismo que explica el enriquecimiento de genes como HLA-A/B/C en nuestro análisis.
Figura 11. Términos GO enriquecidos en ATF3 vs Vehículo (p.adj < 0.05).
La comparación ATF3 vs Aart6 destacó términos específicos como “defense response to symbiont” (p.adj = 2.8e-5) y “FC-gamma receptor signaling pathway involved in phagocytosis” (p.adj = 1.1e-4) (Figura 12), sugiriendo que ATF3 no solo activa IFN-γ, sino también programas transcripcionales amplios contra patógenos. Este perfil amplificado es relevante para aplicaciones en infecciones intracelulares, donde la coordinación entre citoquinas y fagocitosis es crítica [4].
Figura 12. Términos GO enriquecidos en AT3 vs Aart6 (p.adj < 0.05).
En contraste, Aart6 vs Vehículo mostró enriquecimiento en procesos no inmunes como “regulation of neuronal synaptic plasticity” (p.adj = 7.3e-4) (Figura 13) [1]. La ausencia de términos inmunes en Aart6 valida su diseño como control negativo y respalda la especificidad del ATF3, similar a constructos de dedos de zinc no funcionales utilizados en estudios previos [6].
Figura 13. Términos GO enriquecidos en Aart6 vs vehiculo (p.adj < 0.05)
En conjunto, los datos funcionales demuestran que ATF3 activa de manera específica y robusta vías inmunes asociadas a IFN-γ, sin efectos off-target observados en Aart6. Estos hallazgos respaldan su uso en enfoques terapéuticos dirigidos a potenciar respuestas inmunes adaptativas contra enfermedades.
Todos los archivos y scripts se encuentran en GitHub
[1] Heiderscheit, E. A., Eguchi, A., Spurgat, M. C., and Ansari, A. Z. (2018). Reprogramming cell fate with artificial transcription factors. FEBS Lett. 592, 888–900.doi:10.1002/1873-3468.12993
[2] Castro, F., Cardoso, A. P., Goncalves, R. M., Serre, K., and Oliveira, M. J. (2018). Interferon-gamma at the crossroads of tumor immune surveillance or evasion. Front. Immunol. 9, 847.doi:10.3389fimmu.2018.00847
[3] Schoenborn, J. R., and Wilson, C. B. (2007). Regulation of interferon-gamma during innate and adaptive immune responses. Adv. Immunol. 96, 41–101.doi:10.1016/S0065-2776(07)96002-2
[4] Dinarello, C. A. (2000). Proinflammatory cytokines. Chest 118, 503–508. doi:10.1378/chest.118.2.503
[5] Cui, A., Huang, T., Li, S., Ma, A., Perez, J. L., Sander, C., et al. (2024a). Dictionary of immune responses to cytokines at single-cell resolution. Nature 625, 377–384.doi:10. 1038/s41586-023-06816-9
[6] King A, Noblitt D, Sherron O, Kjerfve C, Pless L and Truex NL (2025) An artificial transcription factor that activates potent interferon-γ expression in human Jurkat T Cells. Front. Mol. Med. 4:1492370.doi:10.3389/fmmed.2024.1492370